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QQ , Zusammenfassung 

CN ! Recent Computer simulations of the competition between thousands of languages 

are reviewed, and some new results on language families and language similarities 
• are presented. 

O ■ 1. Einleitung 

^ ■ Bereits im Jahre 2006 hat Kölner Universität die Integration der passenden Di- 

c/3 . daktiken in die Mathematisch-Naturwissenschaftliche Fakultät vollzogen, was im 

! Saarland zu der Zeit eingeleitet wurde, als DS dort war (1974-77, Gruppe Binder). 

^1 Deshalb und weil DS auch jahrzehntelang die Lehramtskommission der Kölner Fach- 

^ ■ gruppe Physik leitete und das Lehramtsstudium gegen die diversen Vorgaben von 

oben verteidigte, sind wir jetzt berechtigt, Herrn Patt zum 70. Geburtstag zu ehren. 
^ . Theoretische Physik ist heute auch nicht mehr das, was sie früher einmal war. 

^ ! Auf dem Computer sind bis zu 10^^ Teilchen simuliert werden, und so können kom- 

I plexe System simuliert werden, wo das Verhalten des Gesamtsystems nicht direkt 

2 ■ aus dem Verhalten der einzelnen Teilchen erschlossen werden kann. Ein Beispiel 

dafür sind reale Gase, die seit 1872 durch die Gleichung von van der Waals ap- 



^ . proximiert werden. Aus der Tatsache, dass sich die Teilchen teilweise anziehen und 

O '. teilweise abstoßen, kann man nicht direkt erkennen, dass es ein Gleichgewicht von 

c/3 I Dampf und Flüssigkeit und eine kritische Temperatur gibt. Auch der Unterschied 

' von Massenpsychologie zur Psychologie der Einzelnen kann als Komplexität gelten. 

j>^' So haben in den letzen Jahren die Physiker auf ihren Computern nicht nur Bio- 

. logie simuliert (Biologie ist eine alte Liebe der Physik, die erst seit kurzem erwidert 

wird), sondern auch Börsenkurse, Meinungsbildung, soziale Netzwerke, • • • [!]• Seit 
2004 hat diese Seuche auch die Sprachwissenschaft erreicht [2], und umgekehrt be- 
^ I nutzen Linguisten auch Methoden aus der Physik komplexer Systeme Diese 

■ Arbeiten [2J führten kurz danach an sechs verschiedenen Unis unabhängig von ei- 

nander zu weiteren Simulationen des Wettbewerbs zwischen Sprachen. Uber diese 
Computersimulation der Wechselwirkung zwischen verschiedenen Sprachen wird hier 
berichtet; eine ausführlichere aber schon veraltende Ubersicht ist [4]. Wir benutzen 
die seit einem halben Jahrhundert in der Physik vorhandenen Methoden der Simu- 
lation einzelner Teilchen, ohne dass wir näherungsweise über viele Teilchen mittein; 
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Realitaet, aus www.ethnologue.org und [3] 
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Abbildung 1: Empirische Verteilung der realen Spracligrößen |3] (oben) und Fami- 
liengrößen [3] (unten). 

in anderen Wissenschaften ist diese Methode neuer und wird oft "Agenten-basiert" 
genannt [S]. Übrigens hat Selten, Wirtschaftsnobelpreisträger in Bonn, schon viel 
früher Spieltheorie auf Sprachen angewandt [6j. 

Heute sprechen die Menschen etwa 7000 Sprachen, davon alleine etwa 800 in 
Papua- Neuguinea. Alle zehn Tage stirbt im Durchschnitt eine Sprache aus. Werden 
in einigen Jahrtausenden alle Menschen die gleiche Sprache (und ihre Varianten) 
sprechen [7]? Können wir die reale Verteilung der Sprachgrößen in einer Simula- 
tion reproduzieren: Wieviel Sprachen gibt es, die jeweils N Leute als Muttersprache 
haben? Diese reale Verteilung in Abb.la ist eine Log-Normal- Verteilung mit einer 
Erhöhung bei den ganz kleinen Sprachen, die nur noch von ein paar Leuten gespro- 
chen werden. Eine Parabel in dieser doppelt-logarithmischen Abbildung entspricht 
einer lognormalen Verteilung. Mandarin- Chinesisch wird von mehr als einer Mil- 
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liarde gesprochen, und etwa 50 Sprachen nur noch von einer Person. 

Im nächsten Abschnitt werden die beiden Modelle erklärt, mit denen wir 7000 
Sprachen gleichzeitig simulieren können, und im übernächsten Abschnitt bringen wir 
ausgewählte Resultate. Uberall zählt die Größe einer Sprache die Zahl der Sprecher 
dieser Sprache. Ein Anhang listet eines der benutzten Fortran-Programme. 

2. Vielsprach-Modelle 

2.1 Schulze-Modell 

Dieses erste Modell für viele Sprachen gibt es in diversen Versionen, deren Resultate 
meist ähnlich sind; hier wird die letzte Version erklärt. Auf jedem Gitterpunkt 
eines L x L Quadratgitters lebt ein Mensch, der genau eine Sprache spricht. Diese 
Sprache wird definiert durch F Eigenschaften, von denen jede durch eine ganze Zahl 
zwischen 1 und Q characterisiert ist. Beispiele sind grammatische Eigenschaften 
wie die Reihenfolge von Subjekt, Objekt und Verb. Typische Werte sind Q = 2 bis 
5, F = 8 oder 16. Bei Q = 2 kann man effizienter rechnen, wenn F = 8, 16, 32 
oder 64 Eigenschaften dann in einem einzigen Computerwort (Bitstring) als Bits 
abgespeichert werden. Bei einer Iteration wird jeder Gitterpunkt einmal behandelt. 

Mit Wahrscheinlichkeit p, unabhängig für jede der F Eigenschaften, ändert sich 
die betrachtete Eigenschaft der am betrachteten Gitterpunkt gesprochen Sprache. 
Diese Wahrscheinlichkeit p ist in der Realität etwa ein Prozent pro menschlicher 
Generation. Außerdem springt mit Wahrscheinlicheit 1 — oder (1 — x)^ jemand 
von einer Sprache, die von einem Bruchteil x der Gesamtbevölkerung gesprochen 
wird, zur Sprache einer zufällig ausgewählten (benachbarten) Person. Letzterer 
Prozess ist eine typisch menschliche Eigenschaft, dass man von einer "kleinen" zu 
einer weit verbreiteten Sprache springt, wie es in der Physikforschung in der zweiten 
Hälfte des 20. Jahrunderts geschah. 

Darüber hinaus können auch (mit Wahrscheinlichkeit q) Eigenschaften von ei- 
nem zufällig ausgewählten Nachbarn übernommen werden. Beispiele für diese lin- 
guistische Diffusion sind französische Lehnworte oder englische Grammatik im Deut- 
schen: "Ich ging in 2005 zweimal zum Friseur". Und obiger Sprung von einer zur 
andereren Sprache wird nur mit Wahrscheinlichkeit r bedacht, also insgesamt mit 
Wahrscheinlichkeit (1 — x)^r gemacht. In Abschnitt 3.1 werden wir noch Löcher ins 
Schulze-Modell bohren oder es auf ein Barabäsi- Albert Netzwerk setzen. 

2.2 Viviane Model 

Die Kolonisierung eines zunächst menschenleeren Kontinents wurde von Viviane 
de Oliveira et al modelliert [S] und wird hier brasilianischem Stil entsprechend mit 
dem Namen Viviane bezeichnet. Zunächst beschreiben wir die ursprüngliche Version 
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[S], dann eine bessere Modifikation in zwei Varianten a und b [Ü]. 

2.2.1 Ursprüngliche Version 

Auf jedem Gitterpunkt j eines L x L Quadratgitters leben entweder Cj Menschen, 
oder niemand, mit 1 < cj < m zufällig gewählt, und m ~ 10^. Auf einem bewohn- 
ten Gitterplatz wird nur eine Sprache gesprochen. Anfangs ist nur ein Gitterpunkt 
bewohnt, so wie Amerika wohl von der Beringstraße aus besiedelt wurde. Danach 
breitet sich die Bevölkerung aus. Schritt für Schritt in einen freien Nachbarn be- 
wohnter Plätze; dieser wird mit einer Wahrscheinlichkeit Cj/m ausgewählt. Dort 
wird erst die Sprache k eines der bewohnten Nachbarplätze gesprochen, der mit 
einer Wahrscheinlichkeit proportional zur Sprachgröße Nk ("Fitness") ausgewählt 
wird. Anschließend ändert sich mit einer Wahrscheinlichkeit a/N'j^ die Sprache am 
neu besiedelten Platz, so dass dort eine neue entsteht, wobei A^^ die kleinere der 
beiden Zahlen N^. und ist, und die Grenze anfangs zufällig zwischen 1 und 
^max ~ 20m festgelegt wird. (In anderen Worten: Die Mutationsrate ist um- 
gekehrt proportional zur Sprachgröße, mindestens aber eine von der Sprachgröße 
unabhängige und zufällig am Anfang festgelegte Wahrscheinlichkeit a/Mk.) Der 
Mutationsfaktor a ist ein freier Parameter. Die neue Sprache bekommt eine neue 
Nummer; andere mehr inhaltliche Sprachelemente hat das ursprüngliche Modell 
nicht. Die Sprachen auf den bereits besetzten Plätzen ändern sich nicht mehr. Die 
Simulation endet, wenn alle Gitterplätze besetzt sind. 

2.2.2 Modifizierte Versionen 

Obiges Viviane-Modell wird beibehalten bis auf folgende zwei Fälle von Mo- 
difikationen, die zu zwei Versionen führen und auf Paulo Murilo de Oliveira [9] 
zurückgehen: 

a) Zunächst kann jeder Sprache des Viviane-Modells ein Bitstring zugeordnet wer- 
den, also eine Kette von 8 bis 64 binären Variablen in den bisherigen Simulationen 
(siehe Programm im Anhang). Diese Bits geben der Sprache einen Inhalt und erlau- 
ben, die Unterschiedlichkeit verschiedener Sprachen zu bestimmen (siehe Abschnitt 
3.2). Wie zuvor führt jede Mutation bei der Besiedlung eines neuen Platzes zu einer 
neuen Sprache. 

b) Stattdessen kann auch eine Sprache nur dann als neu definiert werden, wenn der 
Bitstring sich ändert und eine bisher nicht aufgetretene Folge von Bits darstellt. 
Die Zahl der verschiedenen Sprachen ist dann die Zahl der verschiedenen Bitstrings. 
Die Änderung einer Sprache kann damit auch zu einer bereits vorhandenen Sprache 
führen, etwa wenn das erste Bit von 01011000 von Null auf Eins springt und der 
Bitstring 11011000 schon auf einem anderen Gitterplatz mit einer anderen Vorges- 
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chichte realisiert ist. Außerdem wird berücksichtigt, dass die meisten Gegenden der 
Erde weniger attraktiv sind als die großen Metropolen; die Bevölkerungsdichte c 
zwischen 1 und m wird nicht gleichförmig bestimmt, sondern mit einer Wahrschein- 
lichkeit proportional zu 1/c, analog zu realen Größenverteilung von Städten. Dann 
ist es effizienter, die Auswahl eines unbewohnten Nachbarplatzes proportional zu 
seiner Attraktivität c dadurch zu realisieren, dass zwei solche unbewohnte Nachbarn 
zufällig ausgewählt werden, und der mit dem größeren c anschließend besiedelt wird. 

Start mit Dominanz, rtio=0.9 (+) and 0.5 (x), L=3001,F=8,Q=5,q=0.5,r=0.9,t=300; ': L=10001 

1 I 1 1 1 1 1 
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Wie oben, aber Q = 2 und: F = 8 (+,x) oder 16 r,sq), rho = 0.9 (+,') and 0.5 (x,sq.) 




Abbildung 2: Anteil der am Ende größten Sprache an der Gesamt bevölkerung im 
löchrigen Schulze-Modell. 
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p = 0.1, q = r = 0.9, N = 10-^5 (+), 10"6 (x), 10"7 (*) Groesste Sprache: F=8, Q=5(+) und F=16, Q=2(x) 




1 10 100 1K 10K 100K IM 10M 1 10 100 1000 

Zahl der Sprecher Zahl der Familien 

Abbildung 3: F = 8, Q = 5, 10 Millionen Leute: Anteil der größten Sprache an der 
Gesamtbevölkerung (oben) und Größenverteilung (unten), im Schulze-Modell auf 
gerichtetem Barabäsi- Albert Netwerk. Rechts und unten: p — 0.5, q — 0.59, r = 0.9; 
Steigung -0,525. 



3. Resultate 
3.1 Schulze-Modell 

Wenn anfangs Alle die gleiche Sprache sprechen, dann kann eine hinreichend hohe 
Änderungswahrscheinlichkeit p zu einer Pragmentation führen wie beim Turmbau zu 
Babel: Die Bevölkerung verteilt sich etwa gleichmäßig auf die möglichen Spra- 
chen. Man kann aber auch mit so einer fragmentierten Bevölkerung beginnen und 
dann bei hinreichend kleinem p sehen, wie nach einiger Zeit eine Sprache dominiert 
und von den meisten Leuten gesprochen wird; die Anderen sprechen meist eine Va- 
riante dieser dominierenden Sprache. Wir sehen einen Phasenübergang erster Art, 
mit Hysterese. Nur im Nichtgleichgewicht und mit zusätzhchen Rausch-Effekten 
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L = 20,000; 7500 Sprachen; 5940 Millionen Leute 
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Abbildung 4: Größenverteilung der Sprachen im modifizierten Vi viane- Modell, Fall 
b, 13 Bits pro Bitstring, a = 0.1, m = 63, M^ax = 255. 



[TÜ] konnte eine Größenverteilung ähnlich zu Abb.l simuliert werden. 

Dinge wurden nicht besser, wenn Dreikörper- und Fünfkörper-Kräfte angenom- 
men wurden: Eine Eigenschaft wurde von einer anderen Sprache übernommen nur, 
wenn zwei, oder alle vier, Nachbarn die gleiche Eigenschaft hatten. 

Ganz anders ist die Situation in der löchrigen Version, wenn nur ein zufälliger 
Anteil p aller Plätze bewohnbar ist. "Bekanntlich" bilden sich dann auf dem Qua- 
dratgitter bei p < 0, 593 nur endliche Cluster bewohnbarer Nachbarn, während 
bei p > 0, 593 auch ein unendliches Cluster sich von einem Ende des Gitters zum 
anderen erstreckt. Abb. 2 zeigt nun mit wachsendem p einen kontinuierlichen Ab- 
fall des Anteils der (gegen Ende der Simulation von t Iterationen) größten Sprache, 
ähnlich zum Viviane-Modell: Die Unordnung hat den Phasenübergang zerstört. Die 
Größenverteilung der Sprachen stimmt aber immer noch nicht. 

Besser wird das Schulze-Modell, wenn statt auf zufällig besetzten Plätzen die 
Sprecher auf "scale-free" Netzen vom Barabäsi- Albert Typ sitzen [TT]. Dabei geht 
man von drei miteinander verbundenen Netzwerk-Gründern aus, und addiert danach 
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100 * L=1 0,000; 8(+), 16(x), 32(*), 64(Qu.) Bits 
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100 X L=1 0.000, 5 extra Iterationen Mut.Fakt.=1 
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Abbildung 5: Einteilung der Sprachen in Sprachfamilien im modifizierten Viviane- 
Modell, Summe über 100 Gitter, zu vergleichen mit Abb. Ib. Oben: Fall a,, a — 
0.05, m = 127, M^^ = 255. Unten: Fall b, a = 0.10, m = 63, M^^ = 255. 



neue Mitglieder, eines nach dem anderen. Ein neues Mitglied sucht sich aus den zu 
diesem Zeitpunkt vorhandenen Mitgliedern drei Vorgesetzte aus, proportional zur 
Zahl der Mitglieder, die vorher diese Person als Vorgesetze gewählt haben. 

Abb. 3a zeigt jetzt statt einer dominierenden Sprache einen Wechsel von einer 
zu einer anderen dominierenden Sprache; während des Wechsels sinkt der Anteil 
der größten Sprache in einem kleinen Zeitinterval auf etwa 1/2; dann wird eine an- 
dere Sprache dominierend, und ihr Anteil springt wieder auf nahezu 1 hoch. Dies 
passiert etwa zweimal im betrachteten Zeitintervall t = 1000, für jede der drei ge- 
zeigten Netzgrößen in etwa gleicher Weise. In der Biologie nennt man das "punctua- 
ted equilibrium" . Wenn p anwächst, ergeben sich brauchbare Größenverteilungen 
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Modifiziertes Viviane-Modell, Fall b; Gerade = Zufall 

14 I > > > > > > > > > 1 




Abstand in 1000 

Abbildung 6: Unähnlichkeit zwischen Sprachen als Funktion des geographischen 
Abstands. Die Einheit der horizontalen Achse sind 1000 Gitterkonstanten. Die 
horizontale Gerade zeigt den summierten Hammingabstand an, wenn die Sprachen 
völlig unkorreliert wären. 13 Bits, a = 0.1, m = 63, Mmax = 255, L = 20.000. 

wie in Abb. 3c. (In Abb. 3 wird, wie am Ende von 2.1 erwähnt, mit Wahr- 
scheinlichkeit q eine Sprach-Eigenschaft von einem Vorgesetzten übernommen, und 
der Sprung zu einer Sprache eines zufällig ausgewählten Vorgesetzten geschieht mit 
Wahrscheinlichkeit r(l — x)^.) Auch jetzt ist kein Phasenübergang mehr da. Die 
Größenverteilungen für die Sprachen (als Funktion der Zahl der Sprecher) und für 
die Zahl der Familien (als Funktion der Zahl der Sprachen) sind recht gut, Abb. 3 
unten. 

3.2 Viviane-Modell 

Im ursprünglichen Viviane-Modell stimmt die Größenverteilung besser und erstreckt 
sich in großen Gittern von 1 bis zu einer Milliarde. Nur gibt die doppelt-logarithmi- 
sche Darstellung keine Parabel, sondern zwei Geraden, die zwei Potenzgesetzen ents- 
prechen. Nur wenn wieder Rauschen eingebaut wird, sieht die Verteilung or- 
dentlich aus p. 
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Viel besser funktioniert die von Paulo Murilo de Oliveira (nicht mit Viviane de 
Oliveira verwandt) modifizierte Version (Fall b in Abschnitt 2.2.2). Abb. 4 aus [Ü] 
zeigt eine leicht schiefe Parabel, ähnlich zu Abb.l, mit 6 Milliarden Menschen und 
7500 Sprachen. 

Die Einteilung der Sprachen in Familien (z.B. die indogermanische Sprachfamilie) 
funktioniert in beiden Fällen a und b. Eine neue Sprachfamilie startet genau dann, 
wenn eine gerade mutierte Sprache sich um mindestens i Bits von der historisch 
ersten Sprache dieser Sprachfamilie unterscheidet. Bei i = 1 bildet jede neue Sprache 
eine neue Sprachfamilie: uninteressant. Von i = 2, 3 und 4 funktioniert i = 2 am 
besten, und Abb. 5 zeigt oben i = 2 mit Bitstrings der Länge 8, 16, 32 und 64: Kein 
Einfiuss der Zahl der Bits. Die Gerade hat die Steigung -0,525, die dem empirischen 
Exponenten von —1,905 = —1/0,525 der Realität nach [5] entspricht. Der untere 
Teil zeigt Fall b mit 13 Bits, wobei zu fünf Zeiten im gleichen Abstand auch die 
längst besetzten Plätze ihr Sprache ändern können, wie es dauernd bei den neu 
besetzten Plätzen geschieht. 

Auch die Geographie spielt eine Rolle, und je weiter die Sprachen räumlich vonei- 
nander getrennt sind, um so mehr unterscheiden sie sich im Durchschnitt. Holman 
und Wichmann haben das für die Realität untersucht und eine ganz ähnliche 
Kurve liefert Fall b des modifizierten Viviane-Modells in Abb. 6. Hier wird der Un- 
terschied zwischen den Sprachen durch den Hamming-Abstand zwischen den Bits- 
trings gemessen, also durch die Zahl der verschiedenen Bits bei einem Position- 
für-Position Vergleich der beiden Bitstrings. Wenn die Sprachen gar nicht mehr 
korreliert wären, würden sie in der Hälfte der Bits übereinstimmen, was durch die 
Gerade in Abb. 6 symbolisiert wird. Ahnlich zur Realität [12] sind die Sprachen 
erst dann nahezu unkorreliert, wenn wir von einem Ende des 20.000 x 20.000 Gitters 
zum anderen gehen. 

4. Diskussion 

Nach vielen Anläufen sind im letzten Jahr sind erhebliche Fortschritte dabei gemacht 
worden, die quantitative Ubereinstimmung von Simulation und Realität zu verbes- 
sern. Die Zahl der Sprachen als Funktion der Zahl der Sprecher stimmt gut, Abb. 1 
und 4, die der Zahl der Sprachfamilien als Funktion der Zahl der Sprachen in Abb. 1 
und 5 stimmt einigermaßen. Abb. 6 suggeriert, dass eine Gittereinheit knapp einem 
Kilometer entspricht, was auch mit der Bevölkerungsdichte 1 < c^- < m ~ 10^ zu- 
sammenpasst. Man sollte nach alternativen Modellen suchen, die Ähnliches leisten; 
derzeit ist das Schulze- Modell gegenüber dem Viviane-Modell leicht zurückgeblieben. 

5. Anhang 
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Das folgende Fortran-Programm addiert zum ursprünglichen Viviane Modell nur die 
Bitstrings des modifizierten Viviane-Modells und zählt neben den Sprachen nlang 
auch die Sprachfamilien if am. In den zwei Zeilen vor dem ersten Print-Befehl muss 
nach integer* bzw. data Lg/ die gleiche Zahl 8, 4, 2 oder 1 untereinander angege- 
ben werden für 64, 32, 16 oder 8 Bits pro Bitstring. Zum Schluss wird ausgedruckt 
die Zahl ns der Sprachen einer bestimmten Größe, die Zahl nf der Sprachfami- 
lien (mit Größe = Zahl der Sprachen in der Familie) und das Histogram nhist 
der Zahl der 1-Bits. Die ersten beiden Größen werden in Zweierpotenzen zusam- 
mengefasst, also z.B. von 32 bis 63. Weitere Fragen beantwortet bis Anfang 2008 
Stauf ferOthp . uni-koeln . de. 

Parameter (L=10000 , L2=L*L , L0=1-L , L3=L2+L , L4=25*L+1000 , L5=32767 , 
1 iscale= 7, iniax=ll) 

c language colonization of de Oliveira, Gomes and Tsang, Physica A 
c add bitstring to each language; with Hamming family analysis 
c if am (lang) gives the family to which language "lang" belongs 
c nlang (if am) gives the number of languages within one family 
c grammar bitstring has Lg bytes = 8*Lg bits, integer*Lg grammar 

integer*8 ibm,mult , icount (L5) , j power ,nunipop, nhist (0 : 64) 

integer*2 lang, limit .mother (L5) ,nlang(0:L5) 

byte isite, c 
c byte isite 
c integer*2 c 

dimension neighb(0:3) , isite (L0:L3) ,list(L4) ,lang(L2) ,c(L2) ,f (L5) , 
1 nf (0:40) ,ns(0:40) ,liniit(L5) , grammar (0:L5) ,popct (0 : 255) ,ifam(L5) 

integer*8 grammar ,grammd,bit (0 : 63) 

data Lg/8/, iseed/2/, alpha/0. 05 / ,ns/41*0/ ,nf /41*0/ ,nrun/100/ 
print *, '# ' , L, iseed, alpha, nrun. Lg, iscale, imax, ' >=2' 
c if (iscale .gt . 7 . or . imax. gt . 15) stop 6 
if(Lg.eq.8) kshift=-58 
if(Lg.eq.4) kshift=-59 
if(Lg.eq.2) kshift=-60 
if(Lg.eq.l) kshift=-61 
bit(0)=l 
do 25 i=l,63 
25 bit(i)=ishft(bit(i-l) ,1) 
mult=13**7 
mult=mult*13**6 
ibm=(2*iseed-l)*mult 
ibm=ibm* 16807 
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f actor= (0 . 25d0/2147483648 . OdO) /2147483648 . OdO 
f ac=l . 0/2 . 0**iscale 
do 17 j=0,255 
ici=0 

do 18 i=0,7 
18 ici=ici+iaiid(l,ishft(j 
17 popct(j)=ici 
neighb(0)= 1 
neighb(l)=-l 
neighb(2)= L 
neighb(3)=-L 
do 11 irun= 1 , nrun 
call flush(6) 
do 22 ici=0,64 
22 nhist(ici)=0 
nuiiipop=0 
do 10 j=2,L5 

iilang(j)=0 

ifam(j)=0 

mother(j)=0 

icount(j)=0 

ibm=ibm*mult 

limit ( j ) =l+ishf t (ibm, iiiicLX-64) 
10 f(j)=0.0 

do 6 j=L0,L3 

if ( j . le . . or . j .gt .L2) goto 6 
lang(j)=0 
9 ibm=ibm*16807 

c ( j ) =ishf t (ibm, iscale-64) 
if (c(j) .eq.O) goto 9 
iiuinpop=nuinpop+c ( j ) 
6 isite(j)=0 
c print *, limit, ' limit, c c 
j=L2/2+l 
isite(j)=l 
isite(j+l)=2 
isite(j-l)=2 
isite(j+L)=2 
isite(j-L)=2 
list(l)=j+l 
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list(2)=j-l 

list(3)=j+L 

list(4)=j-L 

i surf =4 

nempty=L2-5 

number=l 

mother (1)=1 

lang(j)=l 

ifam(l)=l 

if amj=l 

nf am=l 

nlangCnf aiii)=l 
nlaiig(0)=0 
grammar (number) =0 
icount(l)=l 
f (l)=c(j)*fac 
c surface=2, occupied=l, empty=0 
c end of initialisation, Start of growth 
do 1 itime=l, 2000000000 
13 ibm=ibm*16807 

index=l . 0+ (0 . 5+f actor*ibm) *isurf 
if (index . gt . isurf . or . index. le .0) goto 13 
j=list (index) 
c if (itime.eq. (itinie/500000 )*500000 ) 

c 1 print*, itime, number, isurf ,nfain 
ibm=ibm*mult 

if (0 . 5+f actor*ibin .ge. c(j)*fac) goto 1 
list (index) =list (isurf ) 
isurf =i surf- 1 

isite(j)=l 

c now select language from random neighbour; prob, propto fitness 

f sum=0 

do 5 idir=0,3 

5 if (isite ( j+neighb(idir) ) . eq. 1) f sum=f sum+f (lang(j+neighb(idir) ) ) 

3 ibm=ibm* 16807 

idir=ishf t (ibm, -62) 

i= j +neighb ( idir ) 

if (isite (i) .ne . 1) goto 3 

ibm=ibni*mult 

if (0. 5+f actor*ibiii .ge. f (lang(i))/f sum) goto 3 
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laiig(j)=laiig(i) 

if am(lang( j ) )=if am(lang(i) ) 
grammar (lang ( j ) ) =gr ammar ( lang ( i ) ) 

f (lang(j))=min(limit(lang(j)) , f(lang(j)) + c(j)*fac) 
now come mutations inversely proportional to fitness f 
ibm=ibm* 16807 

if (0.5+factor*ibiii .lt. alpha/f (lang(j)) ) then 
number=number+l 
if amj=if am(lang(j) ) 
nl ang ( i f am j ) =nl ang ( i f am j ) + 1 
if am (niamber ) =if am j 
if (number.gt.L5) stop 8 
ibm=ibm*mult 
nbit=ishf t (ibm,kshif t) 

grammar (niimber) =ieor (grammar (lang (j ) ) , bit (nbit ) ) 
lang ( j ) =number 
f(lang(j))= c(j)*fac 
mother (number)=mother (lang(i) ) 
end if 

icount(lang(j))=icount(lang(j)) + c(j) 

now determine Hamming distance (grammd) to previous ancestor 
grammd=ieor (grammar (lang ( j ) ) , grammar (mother (lang (i) ) ) ) 
ici=0 

do 23 ibyte=0,Lg-l 

ici=ici+popct (iand(255 , ishf t (grammd, -8*ibyte) ) ) 
if(ici.ge.2) then 

new family Starts here; subtract previously added language 

mother (lang (j ) )=lang(j ) 

nlang ( if am j ) =nlang ( if am j ) -1 

nf am=nf am+1 

if am(lang( j ) )=nf am 

if (nf am. ge . L5) stop 7 

nlang (nf am) =1 
end if 

if (isurf . eq. 0) goto 8 

now determine new surface sites as usual in Eden model 
do 2 idir=0,3 

i= j +neighb ( idir) 

if (i.le.0.or.i.gt.L2) goto 2 

if (isite(i) .ge. 1) goto 2 
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isurf =isurf +1 

if (isurf .gt.L4) stop 9 

iiempty=iiempty- 1 

list (isurf )=i 

isite(i)=2 



if(L.eq.79) print 7, lang 
7 format(lx,79il) 

print *, irun, number, itime, numpop, nfam 
do 11 k=l, number 

if (icount(k) .gt.O) j=alog(float(icount(k)))/0. 69314 
if (k.gt . . and. k. le .nfam. and. nlang(k) .gt .0) then 
i=alog(f loat (nlang(k) ) ) /O . 69314 
nf (i)=nf (i)+l 
end if 

11 ns(j)=ns(j)+l 
jpower=l 

do 12 j=0,37 

if(j.gt.O) jpower=jpower*2 

12 if (ns(j) .gt .0) print *, jpower,ns(j) ,nf (j) 
do 19 j=l, number 

grammd=grammar ( j ) 
ici=0 

do 20 ibyte=0,Lg-l 

20 ici=ici+popct (iand (255 , ishf t (grammd, -8*ibyte) ) ) 
19 n]iist(ici)=nliist(ici)+l 

do 21 ici=0,64 

21 if (nhist (ici) .gt . 0) print *, ici, nhistdci) 
if (nrun.gt . 1) stop 

langsum=0 

do 24 i=l, number 

langsum=langsum+nlang(i) 
24 if (nlang(i)+if am(i) .ne . 0) print *, i, nlang(i) , if am(i) 
print *, langsum 
stop 
end 
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continue 
continue 
continue 



1 
8 
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